رتبه بندی موجودیت در وب داده

پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی
نویسنده هادی خسروی فارسانی
استاد راهنما محمدعلی نعمت بخش
تعداد صفحات: ۱۵ صفحه ی اول
سال انتشار 1391

چکیده

امروزه، موتورهای جستجو به یکی از برنامه های کاربردی بسیار مهمِ وب تبدیل شده اند که هدف آن ها کمک به کاربر در جهت یافتن اطلاعات است. موتورهای جستجو همچون گوگل و یاهو کلمات کلیدی کاربر را دریافت می کنند و در صفحات وب بر اساس الگوریتم های از قبل تعریف شده به دنبال کلمات کلیدی وارد شده می گردند. سپس صفحات بازیابی شده را بر اساس الگوریتم رتبه بندی، مرتب و به کاربر نشان می دهند. با ظهور فناوری وب معنایی، نیاز به الگوریتم های متناسب با این فناوری برای رتبه بندی داده ها بیش از پیش ضروری به نظر می رسد. در این پایان نامه روشی برای رتبه بندی داده ها در داده های پیوندی پیشنهاد شده است. در ابتدا، الگوریتم pagerank توسعه داده شده است و مجموعه های داده رتبه بندی شده اند. سپس، رتبه موجودیت ها در میان موجودیت های مشابه محاسبه می شود. رتبه بندی مجموعه های داده در داده های پیوندی با ایجاد یک گراف جهت دار که گره های آن، مجموعه های داده و پیوندهای آن، تعمیم پیوند بین موجودیت ها به پیوند بین مجموعه های داده است محاسبه می شود. الگوریتم رتبه بندی pagerank بر روی گرافِ ساخته شده اعمال می شود و رتبه گره ها یا همان مجموعه های داده بدست خواهد آمد. رتبه موجودیت های درون مجموعه های داده نیز با استفاده از همان pagerank به صورت جداگانه برای هر موجودیت محاسبه می شود. رتبه نهایی یک موجودیت، برابر است با مجموع رتبه مجموعه داده هایی که به این موجودیت استناد کرده اند. ارزیابی ها نشان دهنده کارایی و دقت بالاتر روش پیشنهادی نسبت به روش pagerank است. رتبه بندی موجودیت های مشابه با استفاده از الگوریتم های خوشه بندی محاسبه شده است. دو روش خوشه بندی در این پایان نامه ارائه شده است. روش اول تنها از ساختار پیوند بین موجودیت ها استفاده می کند و روش دوم همزمان از ساختار پیوند و داده های مربوط به خصوصیت های موجودیت ها استفاده می کند. هر دو روش پیشنهادی برای خوشه بندی موجودیت ها نسبت به کارهای مشابه دارای دقت و سرعت بالاتری هستند. نهایتاً، رتبه گره ها درون مجموعه های داده حوزه ای با استفاده از pagerank محاسبه شده است. ارزیابی رتبه موجودیت با نظر متخصصین در فضای غیر مجازی نشان دهنده چیدمان درست موجودیت ها است.

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

شناسایی موجودیت های همانند در وب داده

وب داده به منظور ایجاد وب قابل فهم برای ماشین ها معرفی شده است که اتصالات معنادار بین موجودیت ها از ویژگی های اصلی آن است. یکی از مهم ترین اتصالات معنادار در وب داده، اتصالات همانندی است که بین موجودیت های همانند ایجاد می شود. شناسایی و اتصال موجودیت هایی که به یک موجودیت یکسان اشاره می کنند ولی دارای شناسه های یکتای منبع متفاوت هستند و در مجموعه داده های مختلفی قرار دارند، موجب می شود عامل ها ...

15 صفحه اول

خوشه بندی موجودیت ها در داده های پیوندی

وب معنایی شامل قرار دادن داده ها روی وب و ساختن ارتباطات به گونه ای است که انسان و ماشین بتوانند محتوای وب داده را کاوش نمایند. هدف وب معنایی افزایش توانایی ماشین ها در دسترسی به منابع موجود در وب، پردازش و بکارگیری آن ها می باشد. با توجه به رشد گسترده ی داده های پیوندی و افزایش مجموعه داده ها در چند سال اخیر، نیاز به ابزاری برای کشف پیوند در مقیاس وسیع احساس می شود. ابزارهای کنونی برای کشف پیو...

15 صفحه اول

رفع اختلاف مقادیر داده ای میان موجودیت های همانند در وب داده ها

وب داده های پیوندی به سرعت در حال گسترش می باشد و در حال حاضر شامل داده هایی از صدها مجموعه داده ی متفاوت می باشد. کیفیت داده های این مجموعه داده ها بسیار متغیر است، به طوریکه ممکن است این داده ها قدیمی، ناقص و یا نادرست باشند. از طرف دیگر امکان دارد مجموعه داده ها اطلاعات متناقضی درمورد یک موجودیت واحد در جهان واقعی ارائه کنند. به منظور استفاده ی برنامه های کاربردی داده های پیوندی از این فضای...

15 صفحه اول

رتبه بندی تحلیل پوششی داده های فازی برمبنای داده های آماری و فاصله اطمینان آماری

متن کامل

رتبه بندی وب‌سایت‌های دانشکده های داروسازی ایران با استفاده از ضریب تاثیرگذار وب

Introduction: Considering the importance of websites in informing users and establishing communications, universities have started to design their own websites for organizing and making their information accessible. Evaluation of these websites through webometric methods will help recognize pitfall and strong points to reach a better quality and constant improvement. This study was aimed...

متن کامل

رتبه بندی و تحلیل حساسیت رتبه های واحدهای تصمیم گیرنده در تحلیل پوششی داده ها بر مبنای ابرصفحه ایده آل

There are many methods for ranking of DMUs. Some of the previous proposed methods may be infeasible and the others cannot rank all DMUs. In this paper,we introduce a new method for ranking of DMUs that is always feasible and can be usd all ranking of all DMUs. the rank of DMUs is acheived based on the ideal hyperplan. The sensitivity of the rank is presented as well. Therefore, in this study, a...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده فنی

کلمات کلیدی

وب معنایی داده های پیوندی خوشه بندی موتور جستجو

میزبانی شده توسط پلتفرم ابری doprax.com